home *** CD-ROM | disk | FTP | other *** search
/ Resource Library: Multimedia / Resource Library: Multimedia.iso / hypertxt / msdos / hypdiss / app-e < prev    next >
Text File  |  1992-04-02  |  44KB  |  865 lines

  1.  
  2.                                      APPENDIX E,
  3.  
  4.                          HYPERTEXT INFORMATION ACCESS STUDY
  5.  
  6.  
  7.                                    INTERVIEW NOTES
  8.                                TONY PHILLIPS INTERVIEW
  9.                                    KENTFIELD, CAL.
  10.                                    MARCH 15, 1991
  11.  
  12.  
  13.  
  14.              A.  HYPERTEXT ARCHIVE TRANSACTION/SUPPORT SYSTEM:
  15.  
  16.              A.1.  Please summarize the basic hypertext document
  17.                   content, assembly & maintenance procedures?
  18.  
  19.                   MaxThink, Inc., Berkeley CA; and Pondlife, Inc.,
  20.                   Kentfield CA; produce the DaTa database, under
  21.                   contract to Deloitte & Touche.  Anthony Phillips is
  22.                   primary author for the DaTa CD-ROM.
  23.  
  24.                   Content - The database consists of both source text
  25.                   and bibliographic reference records relating to
  26.                   American, Canadian, and international auditing and
  27.                   accounting practice.  The input text is selected by
  28.                   Deloitte & Touche professionals, and sent to Phillips
  29.                   almost entirely in hard copy print format.  Phillips
  30.                   estimates that he receives no more than 5% of the
  31.                   material in electronic format, suitable for direct
  32.                   processing.
  33.  
  34.                   Database size - He estimates the database currently
  35.                   consists of some 20,000-25,000 files, maintained in a
  36.                   hypertext network web, which incorporates some 200
  37.                   sub-networks.  The database takes some 80 megabytes of
  38.                   disk space; although there are only approximately 52
  39.                   megabytes of actual text file or "logical" records;
  40.                   the additional disk space is consumed because of the
  41.                   nature of MS-DOS disk sectoring.  Phillips adds or
  42.                   updates approximately 3000-4000 documents per year.
  43.                   This results in addition of about 6 megabytes per
  44.                   year.  He estimates 15% of the database "dies" by
  45.                   replacement or deletion each year.
  46.  
  47.                   Conversion - Since most of the information is in
  48.                   hardcopy form, the data must first be converted to
  49.                   ASCII text in MS-DOS format, for entry into the
  50.                   hypertext system.  They use a Kurzweil Discover 7320
  51.                   OCR unit, a top-of-the-line OCR product, for the
  52.                   conversion.  They elected to use MS-DOS text format,
  53.                   for compatibility with the majority of microcomputers
  54.                   used by field accountants and auditors.  The
  55.                   conversion is labor-intensive and therefore expensive:
  56.                   Phillips estimates that conversion and reformatting
  57.                   accounts for 80% of the total production effort.
  58.  
  59.                   Reformatting need - He points out that ALL the text
  60.                   must be translated into an ASCII format suitable for
  61.                   their simple display.  He says, "What looks good in
  62.                   print sure as hell doesn't look good on the screen!
  63.                   We must do a lot of beautifying."  Phillips states
  64.                   that the extensive reformatting is necessary, since
  65.                   their system must work with the lowest common
  66.                   denominator of end user screen display.  They plan or
  67.                   allow for 24 lines, straight or plain ASCII text
  68.                   display, and for an unknown quality of monitor.
  69.  
  70.                   Reformatting process - Phillips says there are three
  71.                   basic steps in preparing the text for hypertext
  72.                   format:
  73.                         1)  "Get it clean." - This refers to
  74.                   spellchecking and source proofing of the text produced
  75.                   by the OCR conversion.
  76.                         2)  "Chunk it." - He goes through the text, to
  77.                   mark it for splitting into small topical units of
  78.                   nodes, "into lumps that make some sense."  He inserts
  79.                   "flags," or markers for automatic processing with the
  80.                   "File Splitter" utility (below).
  81.                         3)  "Split it." - Phillips uses MaxThink's FS
  82.                   (File Splitter) utility.  This program reads the
  83.                   original text file.  It identifies flagged sections
  84.                   and writes them to separate ASCII files.  It also
  85.                   produces a worklist file, containing the file names,
  86.                   and comments,which were embedded in the identifying
  87.                   flags.
  88.  
  89.                   Updating task - The hypertext textbase has been
  90.                   assembled over the last several years.  As mentioned
  91.                   above, Phillips now estimates that approximately 15%
  92.                   of the material becomes obsolete each year.  He must
  93.                   editorially decide between complete deletion of this
  94.                   material, or whether to leave it for archival record,
  95.                   with indication of the deleted or superseded status.
  96.                   Phillips favors the archival approach, for material of
  97.                   permanent reference value.  He feels that much of this
  98.                   will be important to potential researcher or
  99.                   university users.  "Besides," he says, "it cost us an
  100.                   arm and a leg to get [convert] the stuff! Why throw it
  101.                   away?"
  102.  
  103.              A.2.  GENERAL PRESENTATION AND PRODUCTION DESIGN OF THE
  104.                   HYPERTEXT ACCESS SYSTEM:
  105.  
  106.              A.2.a.  Describe the general arrangement of the main
  107.                   document file.  (Unique document identification,
  108.                   general logical arrangement, basic principle of
  109.                   access)
  110.  
  111.                   The documents are simple ASCII files, stored in a
  112.                   series of disk subdirectories.  Present and earlier
  113.                   generations of MS-DOS can not efficiently store a
  114.                   large number of files in a single disk directory.
  115.                   Overloading a system directory results in poor file
  116.                   retrieval and display performance.  Therefore,
  117.                   Phillips sets a limit of about 100 files per
  118.                   directory, to avoid this degradation.
  119.  
  120.                   Even with this requirement for artificially splitting
  121.                   the files into small subdirectory batches, the
  122.                   MaxThink software can locate and access files fairly
  123.                   easily.  When the software searches for a filename, it
  124.                   automatically searches for a disk subdirectory
  125.                   matching the first 3 characters of the given filename.
  126.                   For example, if searching for a file named
  127.                   "CODE37A.TXT", the software will automatically check
  128.                   for an MS-DOS subdirectory named \COD.  If it is
  129.                   present, it will find the file in that directory.
  130.                   This default check makes it efficient to locate and
  131.                   retrieve files stored in the limited small groups.
  132.  
  133.                   Phillips uses a combination of methods for assignment
  134.                   of files to specific subdirectories.  Some are defined
  135.                   using a simple classification principle, such as
  136.                   issuing agency, journal article source, etc.  He
  137.                   assigns other documents based on a personal conceptual
  138.                   classification system.  To do this, he analyzes the
  139.                   document content according to 1) Entity, or type of
  140.                   organization;  2) Subsystem within the entity; and 3)
  141.                   Transaction type. [In effect, he is using a limited
  142.                   form of facet analysis of the various aspects of the
  143.                   document content - INVESTIGATOR]
  144.  
  145.                   As described above, MaxThink software efficiency
  146.                   depends upon the first three letters of the filename
  147.                   duplicating the three-letters subdirectory code.
  148.                   After he decides upon a specific subdirectory storage
  149.                   location, Phillips then uses a variety of approaches
  150.                   to form the rest of the unique MS-DOS filename.  If
  151.                   the document is issued by an agency or promulgating
  152.                   body, he often uses that agency's document or code
  153.                   number.  He may optionally use his standard syntax for
  154.                   identifying the document section, subsection, page
  155.                   number, etc.
  156.  
  157.  
  158.              A.2.b.  Please summarize the general concepts of the
  159.                   system's "user interface," the document access and
  160.                   display methods, design of the presentation means,
  161.                   etc.
  162.  
  163.                   Software interface:
  164.                   Phillips says the system was designed using a "minimal
  165.                   expectation of user ability."  He calls it a "one-
  166.                   finger system."  After entering the system, the user
  167.                   can traverse the hierarchy and the network connection,
  168.                   and display document content by simply using the four
  169.                   cursor arrow keys.
  170.  
  171.                   There are, of course, other operations handled by a
  172.                   few function and mnemonic alphabetic keys, such as "P"
  173.                   to print a document, "V" to view the hierarchy trail
  174.                   leading to present position, F1 to display Online
  175.                   Help, etc.
  176.  
  177.                   Phillips reports that they attempted to "minimize the
  178.                   mental load for using the system."  He says, "We
  179.                   wanted the information to be the issue, not the
  180.                   software."  "We knew we were on the right tract when
  181.                   we see new users begin interacting with the CONTENT,
  182.                   agreeing or disagreeing with what they see on the
  183.                   screen, within a few minutes of starting to use the
  184.                   product.  They totally forget about the system."
  185.  
  186.                   He feels that other hypertext system designers have
  187.                   let software technology sophistication interfere with
  188.                   simplicity and ease of operation.  "I have a lot of
  189.                   trouble with HyperCard," he says, "because of the
  190.                   plurality of commands.  And, then, when you get to
  191.                   something like OWL Guide, KnowledgePro, and the
  192.                   rest....  The issue's got to be the information, not
  193.                   the software!"
  194.  
  195.                   Conceptual metaphor:
  196.                   As a domain expert, Phillips has developed a
  197.                   conceptual matrix covering the accounting/auditing
  198.                   knowledge domain.  [He is well qualified in this area,
  199.                   with international practice experience with the now-
  200.                   absorbed Touche-Ross firm; and service as their
  201.                   representative to the Financial Accounting Standards
  202.                   Board, a major industry policy body.]
  203.  
  204.                   He has literally translated the detailed conceptual
  205.                   matrix into a interconnected web of over 200
  206.                   hierarchical networks.  He uses network-building
  207.                   tools, described below, to build and maintain control
  208.                   over the intricate knowledge representation. The
  209.                   software lets him build a complex, three-dimensional,
  210.                   conceptual web.
  211.  
  212.                   But at any one point, the user sees only a flat, two-
  213.                   dimensional screen representation of exclusive topical
  214.                   choices.  The system thus retains the hierarchy's
  215.                   advantage of offering clear, simple, choices to the
  216.                   user, at every point.  As Phillips describes it,
  217.                   "Every screen represents a decision on how to reach
  218.                   his answer, to find his topic."  He says their system
  219.                   provides the power to use descriptive metaphors, which
  220.                   can communicate to the user the likely content behind
  221.                   the various screen choices.
  222.  
  223.                   Before working on document access, he says that he
  224.                   must first identify the multiple substantive or
  225.                   "commonsense issues" covered in the document. Like
  226.                   more traditional library catalogers or indexers, he
  227.                   observes that he must do this "without knowing the
  228.                   user's question."  Phillips says that after he
  229.                   positions the document file in the proper storage
  230.                   area, as described above, he must then set about
  231.                   providing multiple access points to the document.  In
  232.                   analyzing a document, Phillips says that he "goes to
  233.                   the bottom of the matrix, and looks up."  He then
  234.                   connects the document to the network trails leading
  235.                   "down" to the pertinent topical areas and nodes.
  236.              A.2.c.  Identify and briefly describe the general
  237.                   production tools or building tools used in
  238.                   construction of the system.
  239.  
  240.                   They use a variety of tools to create the hypertext
  241.                   system:
  242.                         1) "Cleaning and chunking tools" - Turbo
  243.                   Lightning (spell checker) to remove data errors,
  244.                   document-splitting utilities to divide the documents
  245.                   into conceptual nodes, ordinarily a screen or two in
  246.                   length.
  247.                         2) Pre-hypertexting tools - TR (Word
  248.                   processor/Editor), to reformat the document text for
  249.                   best screen presentation.  It is also used for
  250.                   embedding or insertion of hypertext links within
  251.                   directly into text of information base documents.
  252.                 3) Network-building tools - Phillips uses Houdini, a
  253.                   matrix-outliner as the main tool for building and
  254.                   updating the complex hypertext hierarchy and network.
  255.                   He uses Houdini to maintain a "3-dimensional"
  256.                   conceptual map outline if the domain.  He is able to
  257.                   use the matrix outliner  locate or place documents
  258.                   into the network.  He describes this as "creating the
  259.                   conceptual map."
  260.  
  261.                   Phillips simultaneously uses two networked AT-class
  262.                   computers for the hypertext authoring task.  There are
  263.                   also two other microcomputers running, for allied
  264.                   support tasks.  The two networked units run Carousel
  265.                   multi-tasking software.  Each of these machines can
  266.                   simultaneously access the current CD-ROM database, as
  267.                   well as the "new material" on magnetic disk.  The two
  268.                   networked computers each simultaneously operate
  269.                   multiple task copies of a DOS shell utility, the
  270.                   matrix outliner, the CD-ROM software, the TR editor,
  271.                   and other useful utilities.  The end result is that
  272.                   each computer is running simultaneous copies of
  273.                   multiple authoring tools, as well as being networked
  274.                   together.  The networking allows easy file transfer,
  275.                   as well as sharing of the CD-ROM and other peripheral
  276.                   devices.
  277.  
  278.                   This collection of software tools makes it possible
  279.                   for Phillips to handle multiple tasks, as necessary.
  280.                   He begins with the "current" CD-ROM master network as
  281.                   a base for the future network.  He then modifies it to
  282.                   include the new and updated material, and also flags
  283.                   files for deletion.  He is thus constantly updating
  284.                   and modifying the definitions of the multiple included
  285.                   networks.
  286.  
  287.                   As noted, Phillips has multiple sessions running on
  288.                   each machine, with a variety of software tools at
  289.                   hand.  He may use simultaneous, windowed display of a
  290.                   new document in the editor; related older CD-ROM
  291.                   documents loaded into the editor for added linking or
  292.                   modification; Houdini display of the different complex
  293.                   and interlocking networks; a copy of Houdini where he
  294.                   is inputting phrases for the KWOC index; file transfer
  295.                   utilities, etc.
  296.  
  297.                   For example, during the simple interview demonstration
  298.                   of methods to this investigator, he had three or four
  299.                   sessions running on each machine.  Phillips commented
  300.                   that he normally has a total of ten or twelve sessions
  301.                   simultaneously running, on the two network-building
  302.                   machines.
  303.  
  304.                   Phillips also uses the "TransText" editor to insert
  305.                   embedded links directly into document text.  These
  306.                   include hypertext links to topically related files, to
  307.                   network nodes, and linking sequentially preceding and
  308.                   following text files, for documents which have been
  309.                   split up, or "decomposed."
  310.  
  311.                   Phillips feels that the hypertext links embedded in
  312.                   text are obviously important.  But he feels that the
  313.                   conceptual hierarchical network is the major
  314.                   intellectual and access value contribution.  The
  315.                   network links offer multiple access paths to a given
  316.                   topic, much like a multiple-entry library catalog.
  317.                   The major advantage of hypertext is that the source or
  318.                   text material is instantly available for quick
  319.                   retrieval and display at the "end" of the network
  320.                   trails.  This is different from older information
  321.                   retrieval models using final references to remotely
  322.                   stored document media.
  323.  
  324.                   MaxThink CD-ROM production methodology has evolved to
  325.                   the point where their CD service bureau maintains the
  326.                   master working-file tape copies of the "current state"
  327.                   of the CD-ROM.  Phillips now submits only update
  328.                   "changes" to the current database.  These changes
  329.                   typically include:  1) new text and network files; 2)
  330.                   text and network files to be updated (after
  331.                   modification); and, 3) files to be deleted.  The
  332.                   service bureau has developed utilities to merge these
  333.                   changes into the current version, and can then proceed
  334.                   with production of the new CD-ROM.
  335.  
  336.              A.2.d.  Identify and briefly describe the specialized
  337.                   organizational and quality control tools which allow
  338.                   you to build the system.
  339.  
  340.                   Houdini network builder - Phillips feels the most
  341.                   important hypertext-building tool is the Houdini
  342.                   matrix outliner or network-builder program.  He does
  343.                   not use the MaxThink hierarchical [flat] outliner, but
  344.                   only the Houdini program.  He uses it to build complex
  345.                   conceptual networks of domain topics and descriptors.
  346.                   These networks are also interconnected.  The software
  347.                   allow any network node to link to any other network
  348.                   top level node or internal node.  Houdini handles all
  349.                   the necessary network links, and can also display the
  350.                   text of the final referenced document files.  Phillips
  351.                   points out that building a complex conceptual network
  352.                   like this absolutely requires a powerful and
  353.                   sophisticated matrix tool like Houdini.
  354.  
  355.                   KWOC index - Houdini also contains a "glossary-
  356.                   building" tool.  This facility allows the author to
  357.                   selectively flag network topics and descriptive file
  358.                   pointers for inclusion in an online index.  This is an
  359.                   online KWOC index to all flagged network topic levels
  360.                   and documents.  The online index can be easily
  361.                   displayed from virtually any point in the hypertext
  362.                   system.  KWOC entries themselves include hypertext
  363.                   links, affording fast access to any included network
  364.                   level or document node.    The ease of operation makes
  365.                   it an effective and economical indexing mechanism.
  366.  
  367.                   Hypertext editor - Phillips uses the TransText editor
  368.                   to embed or insert interdocument links into the text
  369.                   of document nodes.  This editor can also execute
  370.                   hypertext jumps, so it is an effective authoring tool.
  371.                   He uses it to move throughout the network of text
  372.                   documents, inserting links, making on-the-fly changes,
  373.                   etc.
  374.  
  375.                   But he points out that this work generally involves
  376.                   working with only a limited cluster or area of
  377.                   topically pertinent document files.  Any ASCII editor
  378.                   with multi-document windows is capable of managing
  379.                   such a micro-collection of information.  But he feels
  380.                   that this brute force "editor-only" approach can
  381.                   simply not effectively manage the tens of thousands of
  382.                   documents in a mega-hypertext.  He reiterates that a
  383.                   network manager is absolutely essential for effective
  384.                   hypertext authoring.
  385.  
  386.                   Production tools - There are assorted other tools used
  387.                   for efficient translation of the network into a CD-ROM
  388.                   format.  These are strictly processing tools, and
  389.                   carry no real significance in system creation or
  390.                   conceptual design.
  391.              B.  THE HYPERTEXT INFORMATION ACCESS SYSTEM:
  392.  
  393.              B.1.  ACCESS POINTS - Which of the following types of
  394.                   access points are included in your system?
  395.                 For each question item, please rate using the following
  396.                   categories, and comments as needed...
  397.  
  398.                 P)resent,E)asily achievable,M)odifications needed,N)ot
  399.                   achievable
  400.  
  401.              B.1.a.  Main file sequence - direct file access
  402.                 Category: [P] E M N
  403.  
  404.                   The text files are divided into MS-DOS subdirectories,
  405.                   containing a maximum of about 100-125 files, to
  406.                   maintain DOS efficiency.  Within the system, a file
  407.                   may be directly accessed with a simple "GOTO" command,
  408.                   using the convention of the DOS filename within angle
  409.                   brackets, for example, "<TESTFILE>".
  410.  
  411.              B.1.b.  Author
  412.                 Category: [P] E M N
  413.  
  414.                   MaxThink uses author access within some areas of their
  415.                   information base.
  416.                   Author access may easily be provided by building links
  417.                   from author listings.
  418.                   This is an editorial option.  As Phillips phrases it,
  419.                   "Representation form decision is simply a choice of
  420.                   the best way to represent the information." (This
  421.                   applies to most of the "editorial option" answers
  422.                   below.)
  423.  
  424.              B.1.c.  Title
  425.                 Category: [P] E M N
  426.  
  427.                   Author access may easily be provided by building links
  428.                   from author listings.  This is an editorial option.
  429.                   MaxThink uses author access within some areas of their
  430.                   information base.
  431.  
  432.              B.1.d.   Name forms
  433.                 Category: P [E] M N
  434.  
  435.                   DaTa does not presently use this access approach, but
  436.                   it is an editorial option.
  437.  
  438.              B.1.d.i.  Personal names
  439.                 Category: P [E] M N
  440.  
  441.                   DaTa does not presently use this access approach, but
  442.                   it is an editorial option.
  443.  
  444.              B.1.d.ii. Corporate names (Companies, organizations,
  445.                   government, etc.)
  446.                 Category: P [E] M N
  447.  
  448.                   DaTa does not presently use this access approach, but
  449.                   it is an editorial option.
  450.  
  451.              B.1.e.  Keywords
  452.                 Category: [P] E M N
  453.  
  454.                   The "Glossary" module of the MaxThink software gives
  455.                   KWOC access to both network and file nodes.
  456.  
  457.              B.1.f.  Subject/Topic/Concept
  458.                 Category: [P] E M N
  459.  
  460.                   The network access design is based upon end user
  461.                   choice of topical or subject coverage.  The author
  462.                   describes the network subject choices as "subject
  463.                   metaphors," or "creative descriptions." He attempts to
  464.                   coin these descriptive headings or choices as three-
  465.                   word phrases, per Lakoff.
  466.  
  467.              B.1.g.  Geographic
  468.                 Category: P [E] M N
  469.  
  470.                   DaTa does not presently use this access approach, but
  471.                   it is an editorial option.
  472.                   Phillips notes that it would appear to be a domain-
  473.                   specific value.  If geographical access is
  474.                   implemented, he would recommend providing it with
  475.                   Houdini network input to create Glossary KWOC entries.
  476.  
  477.              B.1.h.  Date, chronological, temporal
  478.                 Category: P [E] M N
  479.  
  480.                   DaTa does not consistently use this access approach,
  481.                   but it is an editorial option.
  482.                   Phillips notes that he occasionally does provide date
  483.                   access for promulgating agency documents.
  484.  
  485.              B.1.i.  Language
  486.                 Category: P [E] M N
  487.  
  488.                   DaTa does not presently use this access approach, but
  489.                   it is an editorial option.
  490.  
  491.              B.1.j.  Document format - book, article, pamphlet, report,
  492.                   etc.
  493.                 Category: P [E] M N
  494.  
  495.                   DaTa does not presently use this access approach, but
  496.                   it is an editorial option.
  497.                   Their file-naming syntax partially provides this kind
  498.                   of information, but Phillips would recommends using
  499.                   Houdini network links to represent it.
  500.  
  501.              B.1.k.  Document position - section, page, location
  502.                 Category: [P] E M N
  503.  
  504.                   This is an editorial representation decision.  The
  505.                   menus or document nodes can reflect and provide access
  506.                   to specific pages, locations, document sections, etc.
  507.                   The MaxThink hypertext runtime software also provides
  508.                   string search access within a text file, and can be
  509.                   used to locate regular heading or pagination forms,
  510.                   etc.  This would not be equivalent to postcoordinate,
  511.                   indexed field, search, but could provide the same kind
  512.                   of access.
  513.  
  514.              B.1.l.  Automated field specifications - record size, entry
  515.                   date, notations, originator, etc.
  516.                 Category: P [E] M N
  517.  
  518.                   The MaxThink hypertext software cannot itself do any
  519.                   kind of Boolean search of the information base.  It
  520.                   DOES have the ability to use links or function keys to
  521.                   invoke external programs.  This can include the
  522.                   ability to run database or text-searching programs on
  523.                   the same (or a surrogate) information base.
  524.              B.2  ACCESS APPROACHES - Which of the following subject or
  525.                   topical information devices are used in your system?
  526.                 For each question item, please rate using the following
  527.                   categories, and comments as needed...
  528.  
  529.                 P)resent,E)asily achievable,M)odifications needed,N)ot
  530.                   achievable
  531.  
  532.              B.2.a.  Classification schemes
  533.  
  534.                   (NOTE:  On opening discussion of this topic area,
  535.                   Phillips observed amusedly that this area of
  536.                   classification schemes was an "entirely subjective"
  537.                   one.  As he put it, "We're pointing to the same box of
  538.                   ASCII files.  If you disagree with my classification,
  539.                   use your own, or use a combination of multiple access
  540.                   structures.")
  541.  
  542.              B.2.a.i.   Hierarchical taxonomy
  543.                 Category: [P] E M N
  544.  
  545.                   The entire basis of the MaxThink approach to hypertext
  546.                   is the use of controlled hierarchical taxonomies,
  547.                   especially in interconnected network form.
  548.  
  549.              B.2.a.ii.  Enumerative, universal, classification [Dewey
  550.                   type classification]
  551.                 Category: P [E] M N
  552.  
  553.                   DaTa does not presently use this access approach, but
  554.                   it is an editorial option.
  555.                   This would be easily implemented by creating or
  556.                   importing the classification file with the MaxThink
  557.                   outliner.  (Phillips describes this tool as the one to
  558.                   use for "hard hierarchies."  The basic classification
  559.                   could then be moved into the Houdini matrix tool, for
  560.                   easy linking to the information base text files.
  561.  
  562.              B.2.a.iii. Specialized, literary warrant, classification
  563.                   [Library of Congress, Reader Interest Classification]
  564.                 Category: P [E] M N
  565.  
  566.                   DaTa does not presently use this access approach, but
  567.                   it is an editorial option.
  568.                   The author could use the same approach for
  569.                   classification operations as in the preceding item.
  570.  
  571.              B.2.a.iv.  Faceted classification (analytico-synthetic)
  572.                   [PRECIS style of indexing] [C., p.65]
  573.                 Category: P [E] M N
  574.  
  575.                   This is an editorial representation decision.
  576.                   In this case the author would need to use external
  577.                   software to build and maintain the faceted
  578.                   classification representation.  The hypertext
  579.                   authoring software could easily import ASCII text file
  580.                   output produced by the external software, and use them
  581.                   in building links.
  582.  
  583.              B.2.b.  Indexing approaches
  584.  
  585.              B.2.b.i.   Alphabetical index, separate or dictionary file
  586.                 Category: [P] E M N
  587.  
  588.                   This is an editorial representation decision, an
  589.                   alphabetical index can be manually produced with the
  590.                   present authoring tools.  The hypertext software can
  591.                   also utilize ASCII text output from standard indexing
  592.                   software.
  593.  
  594.              B.2.b.i.A.  Keywords, extracted or assigned
  595.                 Category: [P] E M N
  596.  
  597.                   The DaTa CD is produced including a KWOC index,
  598.                   produced from assigned descriptive phrases, and
  599.                   descriptive text lines extracted from information base
  600.                   text files.  External software utilities could also be
  601.                   used for keyword extraction.
  602.  
  603.              B.2.b.i.B.  Controlled vocabulary assignment
  604.                 Category: P [E] M N
  605.  
  606.                   DaTa does not presently use this access approach, but
  607.                   it is an editorial option.
  608.                   The author can use manual means, or external software,
  609.                   for maintenance of the controlled vocabulary.
  610.  
  611.              B.2.b.i.C  Relative index, e.g., to Dewey classification
  612.                 Category: P [E] M N
  613.  
  614.                   DaTa does not presently use this access approach, but
  615.                   it is an editorial option.
  616.                   The author can use manual indexing means, or external
  617.                   software, for maintenance of the index.
  618.  
  619.              B.2.b.ii.  Term manipulation indexes (generally for
  620.                   production of printed output)
  621.                 Category: P [E] M N
  622.  
  623.                   DaTa does not presently use this access approach, but
  624.                   it is an editorial option.
  625.                   This would require an external software utility, to
  626.                   produce index in ASCII text format, for hypertext
  627.                   linking source.
  628.  
  629.              B.2.b.ii.A.  Simple permuted or rotated - KWIC
  630.                 Category: P [E] M N
  631.  
  632.                   DaTa does not presently use this access approach, but
  633.                   it is an editorial option.
  634.                   This would require an external software utility, to
  635.                   produce index in ASCII text format.
  636.  
  637.              B.2.b.ii.B.  Ordered by extracted element - KWOC
  638.                 Category: [P] E M N
  639.  
  640.                   The present DaTa CD contains an online KWOC index with
  641.                   hypertext links to network and file nodes.
  642.  
  643.              B.2.b.ii.C.  String indexing (phrase-manipulation, rotation
  644.                   of terms) - PRECIS, NEPHIS, etc.
  645.                 Category: P [E] M N
  646.  
  647.                   DaTa does not presently use this access approach, but
  648.                   it is an editorial option.
  649.                   This would require an external software utility, to
  650.                   produce index in ASCII text format.
  651.  
  652.              B.2.b.ii.D.  Chain indexing (string indexing, with forms
  653.                   reflecting basic taxonomy of terms [C., p. 67]
  654.                 Category: P [E] M N
  655.  
  656.                   DaTa does not presently use this access approach, but
  657.                   it is an editorial option.
  658.                   This would require an external software utility, to
  659.                   produce index in ASCII text format.
  660.  
  661.              B.2.b.iii. Classified index (generally requires secondary
  662.                   alphabetical index, for ease of use) [C., p. 56]
  663.                 Category: P [E] M N
  664.  
  665.                   DaTa does not presently use this access approach, but
  666.                   it is an editorial option.
  667.                   The author can use manual means, or external software,
  668.                   for maintenance of the controlled vocabulary.
  669.  
  670.              B.2.b.iv.  Coordinate indexing - Manual coordination or
  671.                   automated database file, using Boolean search [C., p.
  672.                   60]
  673.                 Category: P [E] M N
  674.  
  675.                   Easily be accomplished by hypertext link call of
  676.                   external text or database searching program.
  677.  
  678.              B.2.b.iv.A.  Older non-automated searching methods -
  679.                   peekaboo, edge-notched cards, Uniterm terminal digit
  680.                   cards
  681.                 Category: P E M [N]
  682.  
  683.                   Not applicable to electronic system.
  684.  
  685.              B.2.b.iv.B.  Database file search - Sequential or indexed
  686.                   field search
  687.                 Category: P [E] M N
  688.  
  689.                   Easily be accomplished by hypertext link call of
  690.                   external text or database searching program.
  691.  
  692.              B.2.b.iv.C.  Full text search
  693.                 Category: P [E] M N
  694.  
  695.                   Easily be accomplished by hypertext link call of
  696.                   external text or database searching program.
  697.  
  698.              B.2.b.v.   Faceted indexing [C., p 65]
  699.                 Category: P [E] M N
  700.  
  701.                   DaTa does not presently use this access approach, but
  702.                   it is an editorial option.
  703.                   The author will need external software, to generate
  704.                   and maintain the faceted index.
  705.  
  706.              B.2.b.vi.  Citation indexing [C., p. 72]
  707.                 Category: P [E] M N
  708.  
  709.                   DaTa does not presently use this access approach, but
  710.                   it is an editorial option.
  711.                   The author can use manual means, or external software,
  712.                   for maintenance of the citation index.  A citation
  713.                   index using hypertext links could display cited
  714.                   electronic text, or could link to external systems for
  715.                   presentation of more information.  This could include
  716.                   online databases, online library catalogs, etc.
  717.  
  718.              B.3.  CONTROL MECHANISMS - Which of the following subject
  719.                   access control measures, intended to control
  720.                   consistency, form, and item sequencing, are present in
  721.                   your system?
  722.                 For each question item, please rate using the following
  723.                   categories, and comments as needed...
  724.  
  725.                 P)resent,E)asily achievable,M)odifications needed,N)ot
  726.                   achievable
  727.  
  728.  
  729.              B.3.a.  Classification schedule
  730.                 Category: [P] E M N
  731.  
  732.                   The domain-specific taxonomy created by Phillips is
  733.                   essentially a "classification schedule," in expanded,
  734.                   networked format.  The matrix outliner affords great
  735.                   flexibility in modifying the "classification" form.
  736.                   It also simplifies relocating the linked text nodes.
  737.  
  738.              B.3.b.  Vocabulary control systems
  739.                 Category: P [E] M N
  740.  
  741.                   This is an editorial decision.  Vocabulary control can
  742.                   be accomplished using manual or external software
  743.                   means.
  744.  
  745.              B.3.b.i.   Authority/Headings files
  746.                 Category: P [E] M N
  747.  
  748.                   This is an editorial decision.  Vocabulary control can
  749.                   be accomplished using manual or external software
  750.                   means.
  751.  
  752.              B.3.b.ii.  Thesaurus control
  753.                 Category: P [E] M N
  754.  
  755.                        This is an editorial decision.  Vocabulary
  756.                   control can be accomplished using manual or external
  757.                   software means.  Simple synonym control is already
  758.                   taken care of in the KWOC index, using a utility
  759.                   program.
  760.  
  761.              B.3.b.iii. Derived-term methods or algorithms
  762.                 Category: P E [M] N
  763.  
  764.                   Possible, using external program, to generate text for
  765.                   import into the hypertext format.  Phillips observes,
  766.                   "If you're a domain expert, you don't need it."
  767.                   (Referring to the person authoring the hypertext.)
  768.  
  769.              B.3.b.iv.  Hierarchical search thesaurus (for database file
  770.                   search)
  771.                 Category: P E M [N]
  772.  
  773.                   Not possible or useful with the hypertext associative
  774.                   linking approach.  Could certainly be a feature of
  775.                   external searching software called up by link
  776.                   commands.
  777.  
  778.              B.3.b.v.   Entry term form control mechanisms
  779.                 Category: P [E] M N
  780.  
  781.                        This is an editorial decision.  Entry form
  782.                   control can be accomplished using manual or external
  783.                   software means.
  784.  
  785.              B.3.b.v.A.    Entry syntax (preferred noun/adjective, etc.,
  786.                   construction form)
  787.                 Category: [P] E M N
  788.  
  789.                   Present editorial practice for entry of network
  790.                   descriptive phrases.  Can easily use external software
  791.                   for greater control, if deemed necessary.
  792.  
  793.              B.3.b.v.B.    Standard number approach (plural, singular
  794.                   form preference)
  795.                 Category: [P] E M N
  796.  
  797.                   Present editorial practice for entry of network
  798.                   descriptive phrases.  Phillips uses software utility
  799.                   to depluralize and clean up glossary index listing.
  800.  
  801.              B.3.b.v.C.    Automatic depluralization (database file)
  802.                 Category: P [E] M N
  803.  
  804.                   Not possible or useful with the hypertext associative
  805.                   linking approach.  Could be a feature of external
  806.                   search software called up by link commands.  Automatic
  807.                   depluralization IS used within the MaxThink KWOC
  808.                   indexing.
  809.  
  810.              B.3.b.v.D.    Synonym definition (database file)
  811.                 Category: P [E] M N
  812.  
  813.                   Not at all possible or useful with the hypertext
  814.                   associative linking approach.  Could be a feature of
  815.                   external search programs called up by link commands.
  816.                   Synonym control IS used within the MaxThink KWOC
  817.                   indexing module.
  818.  
  819.              B.3.c.  "Standard Subdivision" or faceted classification
  820.                   protocol
  821.                 Category: [P] E M N
  822.  
  823.                   Used in present editorial approach, for automatic
  824.                   ordering of network entry types in the glossary index
  825.                   KWOC file.
  826.  
  827.              B.3.d.  Term or descriptor relationships - Roles, links,
  828.                   weighting
  829.                 Category: P E [M] N
  830.  
  831.                   Not currently implemented.  Have considered this
  832.                   possibility, as a "filtration" or "selective viewing"
  833.                   device to help the end user.  Already have "hooks" in
  834.                   the software which could use this approach to display
  835.                   only those links meeting assigned or selected
  836.                   features, instead of all embedded links.
  837.  
  838.              B.3.e.  Filing or sorting rules
  839.                 Category: [P] E M N
  840.  
  841.                   Presently use straight ASCII sort in glossary index
  842.                   listing.  Could alternatively use external utility and
  843.                   use some other sorting algorithm.
  844.  
  845.              B.3.f.   Manual or automated authority/procedural safety
  846.                   measures
  847.                 Category: [P] E M N
  848.  
  849.                   Use multiple backup approaches.
  850.  
  851.                 FILE BACKUP - These files contain copies of taxonomies,
  852.                   multiple networks, index source text and KWOC listing
  853.                   files.
  854.                         1)  Archive of past CD-ROMS, both off- and on-
  855.                   site.
  856.                         2)  Daily streaming-tape backup of active
  857.                   authoring file.
  858.  
  859.                 PAPER BACKUP - Hard copy of the network hierarchies.
  860.                         Produced by printing copy of the network matrix
  861.                   with the MaxThink flat outliner software.  This gives
  862.                   multiple-entry listing of the interlinked network
  863.                   files.
  864.  
  865.